توسعه روشهای مبتنی بر فرض توزیع غیرگوسی برای بهسازی گفتار

thesis
abstract

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین دامنه طیف سیگنال گفتار و هم چنین تخمین ضرایب حقیقی و موهومی طیف گفتار مبتنی بر معیار mmse و map و با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار ارائه شده اند. در سال های اخیر محققان به دنبال واردکردن مدل های احتمالاتی دقیق تری برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند . در این پایان نامه، ابتدا به بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار و هم چنین سیستم تک کاناله تخمین مولفه های دکارتی ضرایب سیگنال تمیز با همان فرض گوسی بودن ضرایب می پردازیم . در ادامه نگاهی به سیستم های بهسازی که مبتنی برفرض غیرگوسی برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند، داریم . در این زمینه، نخست به کمک معیار kullback به دنبال تابع توزیعی هستیم که بر هیستوگرام دامنه گفتار منطبق شود . در این راستا با استفاده از توزیع سوپرگوسین و با تغییر پارامترهایش از نظر معیار kullback به توزیع نمایی رسیدیم که بر هیستوگرام دامنه گفتار منطبق تر است و تخمین گر دامنه طیف سیگنال گفتار را با فرض توزیع نمایی برای دامنه گفتار براساس معیار mmse بدست آوردیم . در ادامه این پایان نامه ، روش تخمین مرتبه متغیر mmse با فرض سوپرگوسین بودن دامنه گفتار را مورد بازنگری قرار داده و تخمین گرهای جدید را استخراج می کنیم. شبیه سازی ها نشان می دهند که با در نطرگرفتن توزیع نمایی برای دامنه گفتار نسبت به حالتی که ضرایب توزیع لاپلاس یا گوسی دارند بهسازی بیشتری از نظر معیار segsnr بدست می آید .

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

In this paper an estimator of speech spectrum for speech enhancement based on Laplacian Mixture Model has been proposed. We present an analytical solution for estimating the complex DFT coefficients with the MMSE estimator when the clean speech DFT coefficients are mixture of Laplacians distributed. The distribution of the DFT coefficients of noise are assumed zero-mean Gaussian.The drived MMSE...

full text

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

در این مقاله یک روش بهسازی گفتار آماری با فرض توزیع مخلوط لاپلاس برای گفتار، برای تخمین سیگنال گفتار تمیز (بدون نویز) از سیگنال گفتار نویزی ارائه شده است. در روش پیشنهادی، ضرایب تبدیل فوریه زمان کوتاه گسسته سیگنال گفتار با استفاده از تخمین گر کمترین میانگین مربعات خطا، بدست می آید. در این تخمین، فرض می شود که تابع چگالی احتمال ضرایب تبدیل فوریه سیگنال تمیز و نویز به ترتیب، مخلوط لاپلاس و گوسی ب...

full text

بهسازی گفتار مبتنی بر روش ترکیبی تفاضل طیفی و برنامه نویسی ژنتیک

در بیشتر محیط های زندگی، نویزهای مختلفی حضور دارد که داده های صوتی را تخریب می کند. در این مقاله روشی را معرفی می کنیم که در آن با استفاده از برنامه نویسی ژنتیک، نویز افزوده شده به داده های صوتی کاهش داده می شود تا داده های با کیفیت بهتری به دست آید. به این منظور ترکیب دو روش تفاضل طیفی و برنامه نویسی ژنتیک برای بهسازی گفتار پیاده سازی شده است. در این روش در مرحله اول، نویز به روش تفاضل طیفی کا...

full text

بهسازی وفقی سیگنال گفتار در محیط‌های واقعی با استفاده از ساختار ترکیبی مبتنی بر شکل‌دهنده‌های پرتو و فیلتر پسینه

تنوع میدان‌های نویزی حاکم بر محیط‌های واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه می‌کند. لذا، داشتن یک شناخت اولیه از میدان‌های نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب می‌شود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبط‌شده در شرایط واقعی، به ارزیابی میدان‌های نویزی پایین‌گ...

full text

استخراج ویژگی‌های مبتنی بر مدل‌سازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار

تحقیقات اخیر نشان می‌دهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار می‌تواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصه‌های تراژکتورهای گفتاری به ندرت در سیستم‌های کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله  روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023